我们研究了对抗性噪声模型中上下文搜索的问题。令$ d $为问题的维度,$ t $为时间范围,$ c $是系统中的噪声总量。对于$ \ eps $ -Ball损失,我们给出了$ o(C + d \ log(1/\ eps))的紧密遗憾,$(d^3 \ log(1/\ eps))\ log^2(t) + c \ log(t)\ log(1/\ eps))$ Krishnamurthy等人(stoc21)的结合。对于对称损失,我们给出了一种有效的算法,后悔$ O(C+D \ log T)$。我们的技术与先前的方法有很大的不同。具体而言,我们跟踪候选向量上的密度函数,而不是由候选向量组成的知识集,该媒介向量与获得的反馈一致。
translated by 谷歌翻译